Search CORE

GENECODIS: a web-based tool for finding significant concurrent annotations in gene lists

Author: Carazo Jose M
Carmona-Saez Pedro
Chagoyen Monica
Pascual-Montano Alberto
Tirado Francisco
Publication venue: BioMed Central
Publication date: 01/01/2007
Field of study

We present GENECODIS, a web-based tool that integrates different sources of information to search for annotations that frequently co-occur in a set of genes and rank them by statistical significance. The analysis of concurrent annotations provides significant information for the biologic interpretation of high-throughput experiments and may outperform the results of standard methods for the functional analysis of gene lists. GENECODIS is publicly available at

Discovering semantic features in the literature: a foundation for building functional associations

Author: Carazo Jose M
Carmona-Saez Pedro
Chagoyen Monica
Pascual-Montano Alberto
Shatkay Hagit
Publication venue: BioMed Central
Publication date: 01/01/2006
Field of study

BACKGROUND: Experimental techniques such as DNA microarray, serial analysis of gene expression (SAGE) and mass spectrometry proteomics, among others, are generating large amounts of data related to genes and proteins at different levels. As in any other experimental approach, it is necessary to analyze these data in the context of previously known information about the biological entities under study. The literature is a particularly valuable source of information for experiment validation and interpretation. Therefore, the development of automated text mining tools to assist in such interpretation is one of the main challenges in current bioinformatics research. RESULTS: We present a method to create literature profiles for large sets of genes or proteins based on common semantic features extracted from a corpus of relevant documents. These profiles can be used to establish pair-wise similarities among genes, utilized in gene/protein classification or can be even combined with experimental measurements. Semantic features can be used by researchers to facilitate the understanding of the commonalities indicated by experimental results. Our approach is based on non-negative matrix factorization (NMF), a machine-learning algorithm for data analysis, capable of identifying local patterns that characterize a subset of the data. The literature is thus used to establish putative relationships among subsets of genes or proteins and to provide coherent justification for this clustering into subsets. We demonstrate the utility of the method by applying it to two independent and vastly different sets of genes. CONCLUSION: The presented method can create literature profiles from documents relevant to sets of genes. The representation of genes as additive linear combinations of semantic features allows for the exploration of functional associations as well as for clustering, suggesting a valuable methodology for the validation and interpretation of high-throughput experimental data

Integrated analysis of gene expression by association rules discovery

Author: Carazo Jose M
Carmona-Saez Pedro
Chagoyen Monica
Pascual-Montano Alberto
Rodriguez Andres
Trelles Oswaldo
Publication venue: BioMed Central
Publication date: 01/01/2006
Field of study

BACKGROUND: Microarray technology is generating huge amounts of data about the expression level of thousands of genes, or even whole genomes, across different experimental conditions. To extract biological knowledge, and to fully understand such datasets, it is essential to include external biological information about genes and gene products to the analysis of expression data. However, most of the current approaches to analyze microarray datasets are mainly focused on the analysis of experimental data, and external biological information is incorporated as a posterior process. RESULTS: In this study we present a method for the integrative analysis of microarray data based on the Association Rules Discovery data mining technique. The approach integrates gene annotations and expression data to discover intrinsic associations among both data sources based on co-occurrence patterns. We applied the proposed methodology to the analysis of gene expression datasets in which genes were annotated with metabolic pathways, transcriptional regulators and Gene Ontology categories. Automatically extracted associations revealed significant relationships among these gene attributes and expression patterns, where many of them are clearly supported by recently reported work. CONCLUSION: The integration of external biological information and gene expression data can provide insights about the biological processes associated to gene expression programs. In this paper we show that the proposed methodology is able to integrate multiple gene annotations and expression data in the same analytic framework and extract meaningful associations among heterogeneous sources of data. An implementation of the method is included in the Engene software package

bioNMF: a versatile tool for non-negative matrix factorization in biology

Author: A Heger
A Pascual-Montano
Alberto Pascual-Montano
DD Lee
DD Lee
DR Carrasco
Francisco Tirado
G Getz
G Wang
J Garcia de la Nava
JJ Dai
JJ Jansen
Jose M Carazo
JP Brunet
K Inamura
KR Lee
M Chagoyen
M Girolami
M Reich
M Scholz
ME Wall
Monica Chagoyen
P Carmona-Saez
P Pehkonen
Pedro Carmona-Saez
PM Kim
Roberto D Pascual-Marqui
S Monti
SC Madeira
SI Lee
TR Golub
TR Hughes
Y Gao
Publication venue: BioMed Central
Publication date: 01/01/2006
Field of study

BACKGROUND: In the Bioinformatics field, a great deal of interest has been given to Non-negative matrix factorization technique (NMF), due to its capability of providing new insights and relevant information about the complex latent relationships in experimental data sets. This method, and some of its variants, has been successfully applied to gene expression, sequence analysis, functional characterization of genes and text mining. Even if the interest on this technique by the bioinformatics community has been increased during the last few years, there are not many available simple standalone tools to specifically perform these types of data analysis in an integrated environment. RESULTS: In this work we propose a versatile and user-friendly tool that implements the NMF methodology in different analysis contexts to support some of the most important reported applications of this new methodology. This includes clustering and biclustering gene expression data, protein sequence analysis, text mining of biomedical literature and sample classification using gene expression. The tool, which is named bioNMF, also contains a user-friendly graphical interface to explore results in an interactive manner and facilitate in this way the exploratory data analysis process. CONCLUSION: bioNMF is a standalone versatile application which does not require any special installation or libraries. It can be used for most of the multiple applications proposed in the bioinformatics field or to support new research using this method. This tool is publicly available at

Docta Complutense

Crossref

ZORA

A literature-based similarity metric for biological processes

Author: A Hyvarinen
A Tanay
AA Petti
AB Maxfield
AG Fraser
AH Tong
Alberto Pascual-Montano
CD Powell
Concha Gil
D Chaussabel
D Lin
D Martin
DD Lee
DE Levin
DM Blei
E Ravasz
EA Adie
G Weeks
H Shatkay
HS Carr
J Tuikkala
Jose M Carazo
L Giot
LH Hartwell
M Ashburner
M Chagoyen
M Vidal
MF Porter
Monica Chagoyen
NJ Krogan
O Bodenreider
P Glenisson
P Khatri
P Pehkonen
P Resnik
P Resnik
Pedro Carmona-Saez
PV Ogren
PW Lord
PW Lord
R Homayouni
RB Cattell
S Deerwester
S Deerwester
S Myhre
T Hofmann
T Sekito
T Yu
U Alon
VL Boyartchuk
X Wu
Z Bar-Joseph
ZN Oltvai
Publication venue: BioMed Central
Publication date: 01/07/2006
Field of study

BACKGROUND: Recent analyses in systems biology pursue the discovery of functional modules within the cell. Recognition of such modules requires the integrative analysis of genome-wide experimental data together with available functional schemes. In this line, methods to bridge the gap between the abstract definitions of cellular processes in current schemes and the interlinked nature of biological networks are required. RESULTS: This work explores the use of the scientific literature to establish potential relationships among cellular processes. To this end we haveused a document based similarity method to compute pair-wise similarities of the biological processes described in the Gene Ontology (GO). The method has been applied to the biological processes annotated for the Saccharomyces cerevisiae genome. We compared our results with similarities obtained with two ontology-based metrics, as well as with gene product annotation relationships. We show that the literature-based metric conserves most direct ontological relationships, while reveals biologically sounded similarities that are not obtained using ontology-based metrics and/or genome annotation. CONCLUSION: The scientific literature is a valuable source of information from which to compute similarities among biological processes. The associations discovered by literature analysis are a valuable complement to those encoded in existing functional schemes, and those that arise by genome annotation. These similarities can be used to conveniently map the interlinked structure of cellular processes in a particular organism

Crossref

Stirling Online Research Repository (RIOXX)

Large expert-curated database for benchmarking document similarity detection in biomedical literature search

Author: Aanei Carmen M.
Abid Muhammad B.
Abramowitz Matthew K.
Abu-Zaid Ahmed
Adamo Vincenzo
Adeyemo Adebolajo A.
Afnan Masoud
Agarabi Cyrus
Aggelidou Maria
Ahmad Haroon
Ahmad Rafi
Aizat Wan M.
Ajani Penelope A.
Akinwumi Sayo A.
Al-Farha Abd A.
Al-Lawama Manar
Al-Owaifeer Adi M.
Al-Riyami Arwa Z.
Alanio Alexandre
Alaux Cedric
Albery Gregory F.
Albiol Joan
Albrecht Dirk R.
Albuquerque Lucia G.
Alhowimel Ahmed
Ali Junaid
Alimba C.G.
Allardyce Judith
Almeida Gabriel M.F.
Alonso-Caneiro David
Alper Ozgul M.
Alshehri Mansour
Alsuhaibani Mohammed
Alzghari Saeed K.
Amer Said E.D.R.
Amir Shimon
Amiya Eisuke
Ammerman Brooke A.
Amorim Rogerio M.
An Qianli
Anazodo Udunna C.
Andersen Stig U.
Andersen Vibeke
Angus Kathryn
Anikin Andrey
Aplin John D.
Argyropoulos Christos
Armitage Charles
Asaduzzaman Muhammad
Asady Hadi
Ascher David B.
Ashry Mohamed
Asmann Yan W.
Assaeed Abdulaziz M.
Atack John M.
Atanasov Atanas G.
Atchison David A.
Atkins Gerald J.
Atlas Lauren
Ato Dai
Avery Simon V.
Avillach Paul
Azubuike Samuel O.
Baade Peter D.
Bach-Mortensen Anders
Backman Lars
Badie Christophe
Bae Taeok
Bagloee Saeed Asadi
Bai Xiaoyong
Baier Dirk
Bail Kasia
Baines Rebecca L.
Baker Chris I.
Bakkach Joaira
Baldi Alfonso
Ball Elizabeth
Ballantyne Maghan
Baltiansky Lior
Ban Bo
Bannon Ross
Bansal Abhisheka
Bar Ido
Bardot Olivier
Barnett Adrian G.
Barraud Pierre
Bartas Martin
Basharat Zarrin
Basner Mathias
Bathelt Joe
Batra Jyotsna
Baumert Philipp
Bazanova O.M.
Beale Andrew
Beck Charles R.
Beck Jill
Becker Daniel
Beddoe Travis
Belachew Kiflemariam Y.
Bell Melanie L.
Ben-Nafa Walid
Benezeth Yannick
Bengtsson-Palme Johan
Benkeser David
Berbesque Colette
Berezikov Eugene
Bergsland Niels
Berners-Price Sue
Bernhardt Peter
Bernier Meghan L.
Berrevoet Frederik
Berry Edward
Berthold Maximilian
Bessa Theolis B.
Beyene Tariku J.
Bhardwaj Vivek
Biedermann Peter H.W.
Bijleveld Erik
Billington Craig
Binder Karin
Birch John
Bittner Florian
Bitzer Michael
Black Emma
Blakely Randy D.
Blanchard Adam M.
Blancher Antoine
Blanck Oliver
Bland Nicholas S.
Blankstein Ron
Blaskovich Mark A.T.
Bleackley Mark
Blombach Fabian
Blum Robert
Boah Michael
Boakye Dominic W.
Bodagh Neil
Boehme Karen A.
Boelaert Marleen
Bogdanos Dimitrios
Bonatsos Vasileios
Bonvin A.M.J.J.
Boon Michele H.
Borges Paulo
Bosch Carles
Bosch Oliver
Bouboulis George
Boudreau Shellie A.
Bourgoin Thierry
Bourke Emer
Bouvard Daniel
Boykin Laura M.
Br\ufchl Albert
Bradley Graeme
Bradshaw William
Bramoweth Adam D.
Brand Thomas
Braubach Oliver
Braun Daniel
Braun R. J.
Brenneisen Peter
Bridges Kristina M.
Bromfield Elizabeth
Brooks Anastasia
Brown James A.L.
Brown Joshua
Brown Peter
Browngardt Christopher
Brownlie Jeremy
Brox-Ponce Josue
Brunetti Arturo
Bukowy-Bieryllo Zuzanna
Bul Kim C.M.
Bull James A.
Bullen Benjamin
Burt Austin
Burton Kathryn J.
Bush Stephen J.
Butkowski Eugene G.
Butler Lisa M.
Byrareddy Siddappa N.
Byrne Hugh J.
Cabantous Stephanie
Cai Yufeng
Calabr\uf2 Giovanna E.
Calatayud Sara
Callahan Tiffany J.
Campana Luca G.
Campbell Matthew
Candal Eva
Canham Colin D.
Cao Bing
Cao Zanxia
Cao Zehong
Cardoso Pedro
Carlson Kimberly
Carninci Piero
Carroll Grace
Carter Dee
Carvajal Richard
Cascella Marco
Casillas S\uf2nia
Castelvetro Valter
Caswell Patrick T.
Catry Thibault
Cavalli Giacomo
Cernava Tomislav
Cerovsky Vaclav
Ch\ue1vez-Fumagalli Miguel A.
Chacko George
Chagoyen Monica
Chakraborty Sayan
Chalmers Kelsey
Chan Sherwin S.
Chandrasekaran Arun R.
Chang Shun C.
Chang Wei
Chao Fengqing
Chao Jie
Charrier Elisabeth E.
Chatterjee Pranab
Chatzitheochari Stella
Che Zhengping
Chen Andrew T.Y.
Chen Branson
Chen Chang-Er
Chen Chang-Shi
Chen Dong F.
Chen Haimin
Chen Hao
Chen He
Chen Huaming
Chen Hui
Chen Jui-Tung
Chen Liming
Chen Xiaoyin
Chen Xin
Chen Yi-Chun
Chen Yinglong
Chen Youning
Chen Yu-Chih
Chen Zhao
Cheng Changxiu
Cheng Jianlin
Cheng Shuiqin
Chenguang [NO FIRST NAME IN SCOPUS]
Cheung Johnny T.K.
Chhatriwalla Adnan K.
Chikowe Ibrahim
Chinapaw Mai
Chinopoulos Christos
Cho William C.S.
Choi Jane R.
Choi Youngrok
Chong Lillian
Chowdhury Debashish
Chowdhury Mohiuddin A.K.
Christensen Martin R.
Christoffersen Tore
Chuang Trees-Juen
Chung Hee-Jung
Chwalibog Andre
Ciresi A.
Cobine Paul A.
Cockcroft Shamshad
Coelho Luis P.
Colella Vito
Collevatti Rosane G.
Comel Jo\ue3o C.
Conesa Ana
Conway Aaron
Cook Penny A.
Cooke Robert S.C.
Cooper David N.
Cooper Jeffrey
Coqueret Olivier
Corea Enoka M.
Cornejo Diego A.V.
Cosacak Mehmet I.
Cosse Cyril
Costa Antonio
Costa Bruno M.
Costa Elisio
Costa Vincent D.
Cottini Marzia
Coupland Carol
Covington Natalie V.
Crawford Stephanie Y.
Cruz Aparecido D.
Cu\uedv P\ue1raic O.
Cuenda Ana
Cui Huijuan
Cui Qiang
Cui Yanru
Culver David C.
Cunningham Catriona
Cuypers Maarten
Cyr Normand
D\u27Angiulli Amedeo
Dahms Tanya E.S.
Dai Zhanwu
Daigle France
Dalgleish Raymond
Dalrymple Brian P.
Danchin Antoine
Danielsen H\ue5vard E.
Dao Myriam
Darras S\ue9bastien
Dauga Delphine
Daulatabad Swapna V.
Davidson Sean M.
Day David A.
de Keersmaecker Kim
de Leeuw Frank-Erik
de Maio Nicola
Dean Lorraine T.
Debrabant Birgit
Degirmenci Volkan
Del Tredici Andria L.
Delahay Robin M.
Delarocque Julien
Demaison Luc
Deng Zaian
Denzel Martin S.
Deschodt Mieke
Devkota Hari P.
Devkota Kiran
Devos Lucie
Devriendt Koenraad
Dhar Aurup R.
Dhariwal Raman
Dhaval [NO FIRST NAME IN SCOPUS]
Diao Jiajie
Ding Jiandong
Ding Ke-Feng
Dings Ruud P.M.
Diodato Daria
Diouf Barthelemy
Dixon Ray
Dlamini S.V.
Doan Lisa V.
Dogan Yunus
Domingues Helena S.
Dong Kexian
Dong X.C.
Dong Zheng
Donner Claudio F.
Dono Marcos
Doxey Andrew C.
Dressick Walter
Drevon Christian A.
Dreyer Niklas
Duan Huiling
Ducho Christian
Ducommun Bernard
Dudley Kevin J.
Duffey Maelle
Dufies Maeva
Duijf Pascal H.G.
Dumaz Nicolas
Dutt Avik
Dwarakanath Bilikere S.
Ebell Mark H.
Echeverr\ueda Natalia
Ecke Thorsten
Eckweiler Denitsa
Eerola Tuomas
Effiong Andem
Egea Luis G.
Ehret Felix
Eisenhardt Steffen
Eixarch Elisenda
Ekstrand Chelsea
El-Adawy Hosny
El-Esawi Mohamed A.
El-Said Mohammed
Elewa Yaser H.A.
Elkum Naser
Emmrich Julius V.
Engel Michael S.
Engel Nadja
Epp Trevor
Erickson Timothy B.
Esfahlani Shabnam S.
Eskelinen Eeva-Liisa
Eskew Evan A.
Esnakula Ashwini K.
Eustace Alex J.
Evangelou Evangelos
Fairhead Michael
Falk Sebastian
Fallah Mazyar
Falter-Wagner Christine M.
Fan Dongsheng
Fan Xiao
Farber Debora B.
Fardet Tanguy
Farhoudi Ramin
Faruk Mohammed
Faville Marty J.
Faye Martin
Feghali Karine A.
Feifei Shi
Fejzo Marlena S.
Feleke Berhanu E.
Ferguson Trevor S.
Fernandez-Fernandez Beatriz
Fernandez-Triana Jose
Festa Fernanda
Feteira Antonio
Feurer Thomas
Feyerabend Frank
Fierz Walter
Filipp Fabian
Flegel Willy A.
Fleres Francesco
Flood-Page Patrick
Florio Tullio
Foley Kieran G.
Forano Evelyne
Forsayeth John
Foster Emma J.
Foster Stephen
Founou Luria L.
Fox Simon A.
Franks Steven J.
Freitas Angela
Frentiu Francesca D.
Friebe Michael
Frilander Mikko J.
Fu Fan
Fu Xinmiao
Fujita Satoshi
Furer Tzvi
Furuta Saori
Fuss Johannes
Gabrielsen Mads
Gadelkareem Rabea A.
Gajda Maksymilian
Galea Ian
Galimov Evgeny
Galluzzi Luca
Gani Federica
Ganpule Arvind P.
Gao Jianzhao
Gao Tian
Gao Yibo
Garc\ueda-Alix Antonio
Garcia-Rivera Enid J.
Garip Gulcan
Gatchell Michael
Gaullier Guillaume
Gazdar Adi
Gebremedhin [NO FIRST NAME IN SCOPUS]
Gedye Kristene
Gelfer Yael
Gemmill Alison
George Ronald B.
Ghelardi Emilia
Ghosh Sayantan
Gianchecchi Elena
Giganti Francesco
Gill Martin R.
Gilliham Matthew
Giordano Maurizio
Giunta Cecilia
Gladue Douglas P.
Gleason Joshua M.
Gleeson Paul A.
Gloyn Liz
Gnasso Agostino
Goarant Cyrille
Gobet Ang\ue9lique
Goggs Robert
Gong Haipeng
Gonz\ue1lezlez-Prendes Rayner
Goodin Amie
Goodyear Carl S.
Gora Diop
Gough Michael J.
Gouil Quentin
Govender Pragashnie
Govinden Usha
Goyal Ravinder
Gr\ue9bert Th\ue9ophile
Gr\ufcneberg Patrick
Grabowski Piotr
Graham Emily B.
Graham Kathryn E.
Grande-P\ue9rez Ana
Graves Patricia M.
Greene Garrett
Greenwald Noah F.
Greidanus Harm
Greiff Victor
Grey James
Grice Darren
Gridneva Zoya
Grimm Dominik G.
Groen Ewout J.N.
Grothe Michel J.
Gruber Jens
Grunau Christoph
Grundle D.S.
Grybos Malgorzata
Guerra-Mora Jos\ue9 R.
Guerrero Fabricio
Guignard L\ue9o
Guisado J.L.
Gumede Nicksy
Gumulya Yosephine
Guo Chengying
Guo Xinyi
Guo Yabin
Gupta Himanshu
Gurevich Vsevolod V.
Gurney-Champion Oliver J.
Gusev Oleg
Guti\ue9rrez-Sacrist\ue1n Alba
H\ufcttner Felix J.
Habes Mohamad
Hacker Elke
Hackshaw Allan
Haenssgen Marco J.
Hage Steffen R.
Hagen Guy
Hahn Steven
Hall Adam
Hall Richard
Haller Dagmar M.
Hammerschmidt Sven
Han Hyemin
Han Jianwei
Han Qian
Han Renzhi
Handfield Martin
Hanson Jack
Haore Gbaguidi
Hapuarachchi Hapuarachchige C.
Harder Timm
Hardingham Jennifer E.
Harper Paul
Harrison Pille
Hartmann Marcus D.
Harvey David J.
Hasler David
Haston Scott
He Shuonan
Heck Michelle
Heers Marcel
Heffler Enrico
Heijne Marloes
Heinemann Stephanie
Heinrich Michael
Helanter\ue4 Heikki
Herbelet Sandrine
Hew Khe F.
Higginbottom Daniel B.
Higuchi Yohei
Hilaire Cynthia St.
Hilton Rachel
Hiroi Noboru
Hobbs Emma
Hodzic Enisa
Hoenner Xavier
Hogg William E.
Hogrebe Alexander
Hojsgaard Diego
Holgate Joan Y.
Hone Andrew
Hongoh Yuichi
Honjo Ken
Horbar Jeffrey
Hori Hikaru
Hu Guoku
Hu Pingzhao
Huang Ancheng
Huang Guangqun
Huang Zhengping
Huber Heinz P.
Huber Michael
Hueso Luis E.
Huirne Judith
Hulse-Kemp Amanda M.
Hunter Kylie E.
Hurt Lisa
Idborg Helena
Ide Kazuki
Ijzerman Adriaan P.
Ikeo Kazuho
Ikonomopoulou Maria P.
Ingley Evan
Iskander-Rizk Sophinese
Iyer Lavanya M.
J\ue9gousse Clara
Jahan Yasmin
Jakeman Philip M.
James Ameh S.
Janga Sarath C.
Janzen Thijs
Jayaraman Jayakumar
Jean-Quartier Claire
Jeltsch Albert
Jensen Arne
Jeon Sang-Min
Jesus Carlos
Jeurissen Patrick
Jia Hong
Jia Husen
Jia Shuqin
Jia Yangyang
Jian Gao
Jiang Fan
Jiang Jianping
Jiang Xingyu
Jibb Lindsay A.
Jin Yi
Jo Daehyun
Joel Emmanuel
Joffroy Bastian
Johnson Andrew M.
Johnson Daniel M.
Johnston Marie
Jongen Stefan
Jonscher Karen R.
Jorens Philippe G.
Jorgensen Jens O.L.
Josse Claire
Joubert Johan W.
Jung Sin-Ho
Junior Antonio M.
Jurman Giuseppe
Jutzeler Catherine
Kabra Dhiraj
Kahan Thomas
Kaiser Stefan
Kalatzis Panagiotis
Kamagata Koji
Kamboj Sunjeev K.
Kambondo George
Kamiya Haruyuki
Kane Nolan C.
Kang Yong-Kook
Kanj Souha S.
Karamanos Yannis
Karim Masud
Karmakar Chandan
Karnati Priyanka
Karp Natasha A.
Karsay Kathrin
Kasian Olga
Kauppila Joonas H.
Kaur Harsheen
Kaya Cihan
Kaye Linda K.
Ke An
Keitel Anne
Kelly Daniel
Kelly Ryan
Kelly Sarah
Kelly Shona
Kempe Andreas
Kenna Ralph
Kennedy Jonathan
Keown Jeremy R.
Kersten Birgit
Khalaf Roy A.
Khalid Javaria M.
Khan Murad M.
Khatlani T.
Kheir Fayez
Khider Tarig
Khoo Chin M.
Khwaja Nyil
Kichatova V.S.
Kickert Rob
Kidibule Peter E.
Kieselmann Jennifer P.
Kievit Rogier A.
Kijanka Gregor S.
Kim Hyeon J.
Kim Yong-Min
King Sarah R.B.
Kinyanjui Timothy
Kiraǧ N\ufckhet
Kish J.K.
Kitazawa Takeshi
Kiyani Musa
Klein Reinhild
Klempnauer Karl-Heinz
Kleppe Andreas
Klump Hannes
Kluz Tomasz
Knox Paul
Kobayashi Tatsuya
Kobold Sebastian
Koch Karl-Wilhelm
Kohanbash Gary
Kohls Gregor
Kohonen-Corish Maija R.J.
Koleva-Kolarova Rositsa G.
Kong Xiangpeng
Konkle-Parker Deborah
Korpela Kalevi M.
Kosanic Sasha
Kostrikis Leondios G.
Koutoukidis Dimitrios A.
Kovesi Tom
Kraiczy Peter
Kramer Paul
Kraschnewski Jennifer L.
Kratz Harald
Krause G\ufcnter
Krebsbach Paul H.
Kristensen S\uf8ren R.
Kristiansson Erik
Kueberuwa Gray
Kugler Jan-Michael
Kulkarni Ameya
Kumar Addanki P.
Kumar Dilip
Kumar Gyanendra
Kumar Narendra
Kumar Nitin
Kumari Prerna
Kunimatsu Akira
Kurdak Hatice
Kurgan Lukasz
Kurniawan Nicholas A.
Kwon Young D.
Labutin Dmitry
Lachat Carl
Lacy-Colson Jon
Lagisz Malgorzata
Lai Hei M.
Laky Brenda
Lalaouna David
Lamberts Aniek
Lammerding Jan
Lange Matthias
Lanza Giuseppe
Larrosa Mar
Laslett Andrew L.
Latif Asam
Lau Colleen L.
Lauschke Volker M.
Laverman Gozewijn D.
Lazo-Langner Alejandro
Le Thuc D.
Leclair Elizabeth E.
Leclercq Guy
Lee Kyung-Woo
Lee Ming-Yih
Lee Moon-Soo
Lee Senhong
Leem Jung W.
Leightley Daniel
Leite Andreia
Lercher Lukas
Lewis James S.
Li Bingling
Li Genyuan
Li Jian
Li Jiansheng
Li Jiuyong
Li Maoteng
Li Qingchun
Li Tangliang
Li Ying
Li Yongzhe
Li You
Li Zhixiu
Liang Dai
Liang Huakang
Liang Shide
Liao Wei-Ting
Liao Zheng-Yin
Lidbury Brett A.
Lieb Klaus
Liehr Thomas
Liew Alan W.C.
Lim Chinten J.
Lim Renly
Lim Yau Y.
Lima Luiz R.A.
Lin Jessica
Lin Li
Lin Michael Z.
Lindsey Merry L.
Line Paul-Dag
Ling Tong
Linn Sabrina N.
Litfin Thomas
Liu Dengcai
Liu Enwu
Liu Fang
Liu Fengbin
Liu Haiyan
Liu Hongde
Liu Siqi
Liu Xiaodong
Liu Yu-Peng
Liu Yuchen
Liu Zhonghua
Liusuo Wang
Lizer J.
Lloyd Vett K.
Lo Te-Wen
Lobreglio Giambattista
Locci Emanuela
Loft Nikolai D.
Loidl Josef
Lopez-Escamez Jose A.
Lopez-Ruiz Francisco J.
Lorenzen Johan
Lorkowski Stefan
Lovell Nigel H.
Lowies Cher
Lu Cheng
Lu Hua
Lu Jin-Jian
Lu Qiang
Lu Wei
Lu Yao
Lu Zhiyong
Luengo Gustavo S.
Lum Fok M.
Lund Bjarte A.
Lundh Lars-Gunnar
Luo Hang
Lussier Alexandre A.
Luu Andreas M.
Lygirou Vasiliki
Lynch Iseult
Lysy Philippe A.
Lyu Ran
Ma Chuang
Ma Lan
Ma Liping
Ma Lisong
Ma Ruiyan
Ma Wujun
Mabb Angela
Machhi Jatin
Mack Heather G.
Mackey David A.
Macleod Angus
Macwan Isaac
Madala Hanumantha R.
Madani Nima
Mahato Ajay K.
Mahavadi Poornima
Mahdavi S.R.
Maher Pamela
Maher Toby
Mai Zhi-Ming
Maibach Edward W.
Maity Sankar N.
Majeed Haroon
Major Rupert W.
Makowiecki Kalina
Malgrange Brigitte
Mali Samira
Mallinson Daniel J.
Mallis Panagiotis
Mamoulakis Charalampos
Mangoni Arduino A.
Manke Thomas
Manstead Antony S.R.
Mantalaris Athanasios
Mao Wenzhi
Marchbank Kevin J.
Margelyte Ruta
Maria Caracausi
Marinello Francesco
Markonis Y.
Marsal Jan
Marschalek Rolf
Marschall H. U.
Marsili Luca
Mart\uedn Carmen S.
Martin Adam
Martin Francis L.
Martinez-Raga Jose
Martinez-Salas Encarnacion
Martinez-Sobrido Luis
Martis Elvis
Marvin-Dowle Katie
Marzocchi Ugo
Mason Leanda D.
Mather Diane E.
Mathieu Daniel
Matsui Yoichi
Mavoa Suzanne
Maza Elie
McCrum Christopher
McCutcheon James E.
McGarrigle Christine A.
McKay Gareth J.
McMillan Brian
McMillan Nigel
McWilliams Lorna
Meads Catherine
Medina Loreta
Megersa Moa
Mendes Caetano S.M.
Menichetti Julia
Mercieca-Bebber Rebecca
Meresh Edwin
Merideth Ben
Merino-Plaza Maria J.
Merlaen Britt
Merrick B. Alex
Meseko Clement
Messina Rossella
Metzger Dennis W.
Meule Adrian
Meunier Frederic A.
Michaelis Martin
Micheau Olivier
Middelveen Marianne
Miele Adriana E.
Mier Pablo
Mihara Hisaaki
Miller Jack J.
Min Rogier
Minde David-Paul M.
Minges Alexander
Mintz Eric M.
Miotla Pawel
Mishra Anand K.
Mishra Eleanor
Mishra Virendra R.
Mitchell Kate M.
Mizukami Takuo
Moal Iain
Moalic Yann
Mohapatra D.P.
Mohebbi Alireza
Molari Massimiliano
Molleman Lucas
Mondal Saiful R.
Montagutelli Xavier
Monteiro Antonia
Montes Matthieu
Moore Matthew D.
Moores Carly
Moran John V.
Morcillo Esteban
Morozov Sergey Y.
Morrice Nicola
Mort Matthew
Moskalensky Alexander E.
Moss W.N.
Mota Jorge
Moultos Othonas A.
Moyer Robert
Mozaheb Zahra
Muhammad Junaid
Mukherjee Maheswari
Murai Noriyuki
Murphy Denis J.
Murphy Susan K.
Murray Shauna A.
Musinguzi Conrad
Muth Thilo
Muyaya Ley
Naganawa Shinji
Nagler Katja
Nakayama Kazuhiko
Nammi Srinivas
Nandakumar Kutty S.
Nandhakumar Amar
Nanou Afroditi
Naqash Amreen
Narayan Edward
Nasios Grigorios
Natoli Roman M.
Navaratnarajah [NO FIRST NAME IN SCOPUS]
Navarin Nicol\uf2
Negera Edessa
Neumann Philipp-Alexander
Ng Grace
Ng Sheryl H.X.
Nguyen Frederique
Nguyen Joe T.
Nguyen Thi T.H.
Ni Duan
Nicol Christine
Nicoletti Rosario
Nida [NO FIRST NAME IN SCOPUS]
Nie Jiyun
Nie Yingjiu
Niehof Monika
Niemeyer Frank
Nilsen Erlend B.
Nilsson Henrik
Nixon Brett
Nobile Clarissa J.
Nolan Fiona
Nolet Philippe
Nord\ue9n Rickard
Nordberg Ana
Norris Adam D.
Notcovich Shirli
Nowicki Jessica P.
Nwaiwu Ogueri
O\u27Mahony Margaret
O\u27Toole Ronan
Obeidat Monther
Ogami Koichi
Oh Deog-Hwan
Ohgami Robert S.
Ohlsson Sophie
Ohst Barnabas
Ohtomo Toshihiko
Olatunbosun Oluremi
Oldenmenger Wendy H.
Ollivier Quinn R.
Olofsson Per
Olova Nelly
Olszewski Pawel
Olumayede Emmanuel
Onzima Robert
Orme Mark W.
Ortiz Alberto
Osses Dani\uebl F.
Oster Henrik
Ostrikov Kostya
Otto Siegmar
Ou Jianhong
Outeiro Tiago F.
Ouyang Songying
Owais Mohammed
Pace-Asciak Pia
Paganoni Sabrina
Page Andrew
Pallebage-Gamarallage Menuka
Palm Christoph
Palma Jose-Alberto
Pan Chih-Long
Pan Zihang
Panthee Suresh
Panwar Ajay
Paradies Yin
Parchi Piero
Park Caroline
Park Charny
Park Dong I.
Park Seyoung
Parsons Jerod R.
Parsons Michael H.
Parsons Nick
Pascal Pigny
Paterson Russell
Patil Chandrashekhar D.
Patterson Chris
Paul Elisabeth
Pearce Simon P.
Pearson James A.
Peckham Michelle
Pedemonte Nicoletta
Pedro Sansoa A.
Peifer Mark
Pelkonen Tuula
Pelleri Maria C.
Pellizzon Michael A.
Penagos-Tabaree Felipe
Peng Xiangda
Peng Yousong
Perco Paul
Pereira Joana L.
Peres Marco A.
Perry Samuel R.
Peter Jessica
Peterson Brent M.
Petrelli M.
Pezzuolo Andrea
Pheko Mpho
Pianosi Paolo T.
Pichugin Alexander
Pinto Carlos J.C.
Pinto Ines M.
Pinto Karina A.
Pinzi Valentina
Piotrowski Marcin
Piovesan Allison
Plantinga Arnoud
Plevris John N.
Pluess Michael
Podolsky Illya M.
Pollesello Piero
Polz Martin
Ponti Giovanna
Popoola Segun I.
Porcelli Piero
Portilla Maribel
Portillo M.C.
Pourret Olivier
Pozdnyakov Ilya
Prajapati Anilkumar S.
Pranata Raymond
Prescott Julie
Pridans Clare
Prieto Daniel
Prince Martin
Pritchard Antonia L.
Psaroulaki Anna
Pujala Ravi K.
Pulia Michael
Pulido-Arjona Leonardo
Pullan Wayne
Pusch Stefan
Qi Dongchen
Qi Peng-Fei
Qi Xingshun
Qian Siyu
Qin Lei
Quinn Gwendolyn P.
Quinn Terence J.
Rafe Ali
Rafiq Muhammad
Raghava Gajendra P.S.
Rahimi Farid
Rahman Proton
Rahman Shaifur
Rai Nayanjot K.
Raikou Vaia D.
Raman Ayush
Ramula Satu
Ranft Andreas
Raote Ishier
Rappsilber Juri
Rassaf Tienush
Raucher-Ch\ue9n\ue9 [NO FIRST NAME IN SCOPUS]
Rawski Rafal
Ray Asit
Raza Ali
Razak Lubna A.
Rebl Henrike
Reddan Tristan
Refai Osama
Refardt Julie
Regan Tim
Rehfeldt Florian
Reiling Jan H.
Remacle Claire
Reschke Cristina R.
Rezaei Mohsen
Rhodes Johanna
Ricciardi Walter
Richa Tambi
Richardson Mark F.
Riddick Eric W.
Riess Olaf
Ritter Uwe
Riva Giuseppe
Roach Neil W.
Roberts David D.
Roberts Nicola J.
Robinson K.R.
Robles Guillermo
Rodrigues Tiago
Rodriguez Cesar
Roislien Jo
Roobol Monique J.
Ross Kehinde
Ross Stephanie A.
Rossoni Luca
Rotge Jean-Yves
Rouet Romain
Rovas Alexandros
Rowe Alexandra
Rowe Anna D.
Rudolf Kevin
Ruepp Andreas
Rusch Peter
Rust Petra
S\uf6relius Karl
Saad Sonia
Sabnis Sandeep C.
Sack George H.
Sacks Frank M.
Sadoine Margaux L.
Safaei Soroush
Saggar Manish
Saito Yu
Salama Mohamed F.
Saleh Sherif
Sallmon Hannes
Sampson Christopher
Santos Manuela
Saudemont Aurore
Sava Gianni
Schmidt Axel
Schmutz Axel
Schneeberger Pierre H.H.
Schrading Simone
Schramm Alexander
Schreiber Martin
Schuele Birgitt
Schuler Sidney
Schulte Leon N.
Schuon Robert A.
Schurr Roey
Schwotzer Daniela
Schymkowitz Joost
Sczyrba Alexander
Searles Stephen
Sebastian Agata
Seib Kate L.
Selinski Jennifer
Seltmann Stefanie
Senghore Thomas
Seow Esmond
Sepanski Robert
Sergeant Kjell
Sha Feng
Shabalin Ivan G.
Shahid Shaouli
Shalchyan Vahid
Shalev Nir
Shang Jin-Long
Sharma Neeraj
Sharma Saurab
Sheehan Barry
Shen Jun
Shi Chunhu
Shi Han-Ping
Shimada Tomohiro
Shin Jeon-Soo
Shirvalkar Prasad
Shiryayev Oleg
Shohayeb Belal
Shortt Colette
Siebers Robert
Sillanp\ue4\ue4 Elina
Silveyra Patricia
Singer Josef
Singh Jugpreet
Singh Mandeep
Singh Manisha
Skinner Debra
Small Ian
Smeets Paul A.M.
Smith Simon S.
Smith Taylor
Smout Michael J.
So Po-Wah
Soares Ant\uf3nio
Solano Francisco
Solomon-Moore Emma
Sommerlad Andrew
Sonenshine Daniel E.
Song Chunjiao
Song Haijun
Song Jiangning
Song Lijuan
Soraggi Samuele
Sorzano Carlos O.
Southall Tony
Speakman John R.
Spearman Paul
Srinivasan Mandyam V.
Srivastava Kshitij
Srivastava Rupesh K.
Stabile Laura P.
Staege Martin S.
Stanley Ryan
Stasiak A.
Steadman Kathryn J.
Steckhan Nico
Stein Nils
Stella Alessandro
Stephens Andrew W.
Stevanovic Dejan
Stewart Christopher J.
Stewart Douglas I.
Stine Keith
Storlazzi Curt
Stoynova Nataliya V.
Strehlow Jan
Strobl Frederic
Strzalka Wojciech
Suarez Oscar M.
Subhash Santhilal
Subissi Lorenzo
Subramaniapillai Mehala
Sukocheva Olga
Sultana Taranum
Sumant Anirudha V.
Summers Mathew J.
Sun Gang
Sun Jim
Sun Xianbao
Sundar Raghav
Supriyanto Irwan
Surve Chinmay R.
Suzuki Tomo
Swali Ritu
Sydes Matthew
Syme Caitlin
Szabo Attila
Szymanski Wiktor
Tacon Paul
Taherzadeh Ghazaleh
Tahir Nur D.M.
Tai Chan N.P.
Takeuchi Hisashi
Tamaian Radu
Tan Aik-Choon
Tan Cher M.
Tan Ene-Choo
Tan Kok H.
Tanadini-Lang S.
Tanaka Kozo
Tang Fei
Tang Haixu
Tang Jun
Tang Young
Tanino Y.
Tantawy Marwa
Tao Wanyin
Targett-Adams Paul
Tayebi Mourad
Tayyem Reema
Tebbe Christoph C.
Telfer Evelyn E.
Tellechea Juan I.
Tempel Wolfram
Tennakoon Sumudu
Teodorczyk-Injeyan Julita A.
Terrier Olivier
Teseo Serafino
Testa Jean
Testoni Ines
Theron G.
Thijs Gert
Thomas Lisa-Marie
Thorne Sally
Thrift Amanda G.
Tian Chang F.
Tian Yu-Shi
Tian Zhiqi
Tiffon Celine
Tingting Qian
Tinnefeld Philip
Tjahjono Daryono H.
Toelzer Christine
Tofani Marco
Tolle Fabrice
Tomov Nikola
Tong Xin
Torga Gonzalo
Toth Ervin
Tovar Miguel
Tr\uf6der Simon E.
Tran Linh
Tressoldi Patrizio
Tripathi Sushil
Tsapas Apostolos
Tsirigotis Konstantinos
Tuladhar Anil M.
Turak Ayse
Tuttle Lisa M.
Tuttle Neil
Tzotzos George
Uchendu Florence
Udo Edet E.
Uhle Florian
Ukubuiwe Azubuike C.
Ung Carolina O.L.
Utsumi Toshiaki
Uversky Vladimir N.
Vaidyanathan Subramanian
Vaillant Michel
Valenti Anna
Valgepea Kaspar
Valsesia Armand
van de Mortel Thea
van den Bos Wouter
van Dessel Pieter
van Meerten Tom
van Nieuwerburgh Filip
van Raaij Mark J.
van Ruitenbeek Jan
Vandenbroucke Roosmarijn E.
Vanneste Sven
Vatanparast Hamid
Vavvas Demetrios G.
Veiga Feliciano H.
Vendrell Marc
Verheijen Geert P.
Verloh Niklas
Verlot Pierre
Vesk Peter A.
Veys Ralf
Vickers Paul
Vickstrom Casey
Victor Victor M.
Vidal Arnau
Villemur Richard
Villet Martin H.
Vindin Howard
Vitriol Veronica
Viveiros Miguel
Vohl Marie-Claude
Voolstra Christian R.
Vorholt Julia A.
Voskarides Konstantinos
Voutchkova Denitza D.
Vuillemin Anne
Wakelin Steven
Waldron Levi
Walker Mirella
Walsh Laurence J.
Wang Amanda Y.
Wang Fang
Wang Fuan
Wang Horng-Dar
Wang Jinhui
Wang Jiucun
Wang Jun
Wang Qing
Wang Teng
Wang Xiaomin
Wang Yun
Wang Zhenxing
Watanabe Yoichi
Watari Ricky
Waugh Jason
Webb S.A.
Webster Rebecca
Webster Ruth
Wei Junnian
Wei Pan
Weigert Andreas
Weinstock Christof
Welter Danielle
Wen Jet-Chau
Werner Gijsbert D.A.
Werten Sebastiaan
Westermair Anna L.
Wham Carol
White Ethan P.
Wibowo David
Widera Darius
Wiener Jan
Wilharm Gottfried
Wilkinson Simon
Williams Brendan A.
Williams Richard
Willmann Raffaella
Wilson Alex
Wilson Coralie
Wingenbach Tanja S.H.
Winslade Matthew
Wirth Brunhilde
Wojan Timothy R.
Woldesemayat Adugna A.
Wolff Mathieu
Wong Alvin
Wong Bryan M.
Workman Alan D.
Wu Dalei
Wu Tzu-Wei
Wu Yi-Rui
Wuerbel Hanno
Wyart [NO FIRST NAME IN SCOPUS]
Xavier Rose M.
Xia Wenfeng
Xiang Tingxiu
Xiao Han
Xiao Shumin
Xiao Xiangshu
Xie Li-Xin
Xiong Peng
Xu Beisi
Xu Dong
Xu Haotian
Xu J.W.
Xu Jialin
Xu Jianping
Xu Juan
Xu Jun
Xu Shicai
Xu Shilin
Xu Taosheng
Xu Ziyue
Xue Bin
Xue Yu
Yadollahpour Ali
Yalcin Suayib
Yamato Masayuki
Yan Hong
Yang Chongjun
Yang Dongdong
Yang En-Cheng
Yang Hui
Yang Long
Yang Mingjun
Yang Shiqi
Yang Sunny Y.
Yang Wei
Yang Yongliang
Yankilevich Patricio
Yao Ruifeng
Yao Wen
Yassine Abdul-Amir
Ye Yuzhen
Ye Zhi-Qiang
Yeung Andy W.K.
Yin Cong-Cong
Yin Qinan
Yli-Kauhaluoma Jari
Yoneyama Hiroshi
Yoon Jihoon G.
You Yuyi
Yousefzadeh Abbas
Yu Chenglong
Yu Ying
Yu Yongbo
Yuan Christina M.
Yuan Guo-Cheng
Yuh Chiou-Hwa
Zabetakis Ioannis
Zaccolo Manuela
Zaitsu Masayoshi
Zare Asma
Zaritsky Arno
Zaucha Jan
Zeineb Zian
Zeng Chen
Zeng Erliang
Zeng Zhen
Zevnik Branko
Zhan Jian
Zhan Xiao-Yong
Zhang Chengrong
Zhang Chi
Zhang Chongxing
Zhang Gong
Zhang Haowen
Zhang Jilei
Zhang Junpeng
Zhang Kai
Zhang Li
Zhang Linxing
Zhang Rongqiang
Zhang Tongchuan
Zhang Tuo
Zhang Wei
Zhang Weijia
Zhang Xianglilan
Zhang Xiaolei
Zhang Yao
Zhang Yi
Zhang Yingkai
Zhang Yusen
Zhang Zhe
Zhang Zhiyong
Zhang Zhong-Yin
Zhang Zhongheng
Zhao Guoyan
Zhao Haochen
Zhao Jing
Zhao Xin
Zhao Yuan
Zheng Shan
Zhou Bailing
Zhou Jianyu
Zhou Kai
Zhou Min
Zhou Xiaofan
Zhou Xiaoyan
Zhou Yaoqi
Zhu Dongjie
Zhu Shu
Zhu Zhenxing
Ziegler Andreas
Zinke Katharina
Zuberbier Torsten
Zuckerman Hannah
Publication venue
Publication date: 01/01/2019
Field of study

Document recommendation systems for locating relevant literature have mostly relied on methods developed a decade ago. This is largely due to the lack of a large offline gold-standard benchmark of relevant documents that cover a variety of research fields such that newly developed literature search techniques can be compared, improved and translated into practice. To overcome this bottleneck, we have established the RElevant LIterature SearcH consortium consisting of more than 1500 scientists from 84 countries, who have collectively annotated the relevance of over 180 000 PubMed-listed articles with regard to their respective seed (input) article/s. The majority of annotations were contributed by highly experienced, original authors of the seed articles. The collected data cover 76% of all unique PubMed Medical Subject Headings descriptors. No systematic biases were observed across different experience levels, research fields or time spent on annotations. More importantly, annotations of the same document pairs contributed by different scientists were highly concordant. We further show that the three representative baseline methods used to generate recommended articles for evaluation (Okapi Best Matching 25, Term Frequency-Inverse Document Frequency and PubMed Related Articles) had similar overall performances. Additionally, we found that these methods each tend to produce distinct collections of recommended articles, suggesting that a hybrid method may be required to completely capture all relevant articles. The established database server located at https://relishdb.ict.griffith.edu.au is freely available for the downloading of annotation data and the blind testing of new methods. We expect that this benchmark will be useful for stimulating the development of new powerful techniques for title and title/abstract-based search engines for relevant articles in biomedical research.Peer reviewe

University of Groningen

Publikationsserver der Universität Tübingen

Edinburgh Research Explorer

Electronic Publication Information Center

UNSWorks

Warwick Research Archives Portal Repository

Digitala Vetenskapliga Arkivet - Academic Archive On-line

Bournemouth University Research Online

UPF Digital Repository

Trepo - Institutional Repository of Tampere University

White Rose Research Online

Högskolebiblioteket i Halmstad Publikationer

International Migration, Integration and Social Cohesion online publications

UDORA - University of Derby Online Research Archive

Central Archive at the University of Reading

Proceedings - University of Groningen

LSHTM Research Online

VBN

ABACUS. Repositorio de Producción Científica

Research Online

Apollo (Cambridge)

University of Melbourne Institutional Repository

UPSpace at the University of Pretoria

Northumbria Research Link

Southampton (e-Prints Soton)

PubliCatt

ACU Research Bank

Coventry University Pure Portal

TamPub Julkaisuarkisto - TamPub Institutional Repository

Erasmus University Digital Repository

Helsingin yliopiston digitaalinen arkisto

Institute of Cancer Research Repository

Lirias

Repository for Publications and Research Data

Lund University Publications

Kölner UniversitätsPublikationsServer

KU ScholarWorks

OPUS - University of Technology Sydney

Archivio della Ricerca - Università di Pisa

eScholarship - University of California

Archivio della ricerca- Università di Roma La Sapienza

Institutional Research Information System University of Turin

LJMU Research Online (Liverpool John Moores University)

LAReferencia - Red Federada de Repositorios Institucionales de Publicaciones Científicas Latinoamericanas

ResearchOnline at James Cook University

Repositori d'Objectes Digitals per a l'Ensenyament la Recerca i la Cultura

University of Canberra Research Repository

Repositorio Institucional Universidad de Granada

Repositori Obert UdL

Chalmers Research

Archivio istituzionale della ricerca - Università di Genova

Archivio istituzionale della ricerca - Università di Padova

Archivio istituzionale della ricerca - Università di Urbino

Archivio della ricerca - Fondazione Bruno Kessler

Publikationer från Uppsala Universitet

Ghent University Academic Bibliography

Copenhagen University Research Information System

Research Repository

Archivio istituzionale della ricerca - Alma Mater Studiorum Università di Bologna

Institutional Repository Universiteit Antwerpen

Bern Open Repository and Information System (BORIS)

ScholarBank@NUS

Cold Spring Harbor Laboratory Institutional Repository

HAL Clermont Université

Sheffield Hallam University Research Archive

The University of Arizona

Spiral - Imperial College Digital Repository

DI-fusion

The University of Manchester - Institutional Repository

Stirling Online Research Repository

University of Twente Research Information

UvA-DARE

MPG.PuRe

Hacettepe University Institutional Repository

Maastricht University Research Portal

University of Regensburg Publication Server

ARTS repository - University of Groningen

HAL-Inserm

National Health Research Institues

ArchiMer - Institutional Archive of Ifremer

HAL-INSU

edocUR

Western Sydney ResearchDirect

University of Dundee Online Publications

Jagiellonian Univeristy Repository

University of East Anglia digital repository

HAL-Pasteur

Dissertations of the University of Groningen

Predicting biological pathways of chemical compounds with a profile-inspired approach

Author: Florencio Pazos
Javier Lopez-Ibañez
Monica Chagoyen
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 01/01/2021
Field of study

Abstract Background Assignment of chemical compounds to biological pathways is a crucial step to understand the relationship between the chemical repertory of an organism and its biology. Protein sequence profiles are very successful in capturing the main structural and functional features of a protein family, and can be used to assign new members to it based on matching of their sequences against these profiles. In this work, we extend this idea to chemical compounds, constructing a profile-inspired model for a set of related metabolites (those in the same biological pathway), based on a fragment-based vectorial representation of their chemical structures. Results We use this representation to predict the biological pathway of a chemical compound with good overall accuracy (AUC 0.74–0.90 depending on the database tested), and analyzed some factors that affect performance. The approach, which is compared with equivalent methods, can in addition detect those molecular fragments characteristic of a pathway. Conclusions The method is available as a graphical interactive web server http://csbg.cnb.csic.es/iFragMent